智能论文笔记

On Meritocracy in Optimal Set Selection

Thomas Kleine Buening , Meirav Segal , Debabrota Basu , Christos Dimitrakakis , Anne-Marie George

分类：人工智能

2021-02-23

通常，根据某些固有的价值衡量标准，绩效是定义的。相反，我们考虑一个个人的价值为\ emph {相对}的设置：当决策者（DM）选择一组从人口中的个人来最大化预期效用时，自然考虑\ emph {预期的边际贡献}（每个人的emc）。我们表明，这个概念满足了这种环境公平性的公理定义。我们还表明，对于某些政策结构，这种公平概念与最大化的预期效用保持一致，而对于线性实用程序功能，它与Shapley值相同。但是，对于某些自然政策，例如选择具有一组特定属性的个人的政策（例如，大学入学的足够高考试成绩），精英级和公用事业最大化之间存在权衡。我们根据挪威大学的大学录取和成果，分析了限制对政策对效用和公平性的影响。

translated by 谷歌翻译

GRelPose: Generalizable End-to-End Relative Camera Pose Regression

Fadi Khatib , Yuval Margalit , Meirav Galun , Ronen Basri

分类：计算机视觉

2022-11-27

This paper proposes a generalizable, end-to-end deep learning-based method for relative pose regression between two images. Given two images of the same scene captured from different viewpoints, our algorithm predicts the relative rotation and translation between the two respective cameras. Despite recent progress in the field, current deep-based methods exhibit only limited generalization to scenes not seen in training. Our approach introduces a network architecture that extracts a grid of coarse features for each input image using the pre-trained LoFTR network. It subsequently relates corresponding features in the two images, and finally uses a convolutional network to recover the relative rotation and translation between the respective cameras. Our experiments indicate that the proposed architecture can generalize to novel scenes, obtaining higher accuracy than existing deep-learning-based methods in various settings and datasets, in particular with limited training data.

translated by 谷歌翻译

Detecting Suicide Risk in Online Counseling Services: A Study in a Low-Resource Language

Amir Bialer , Daniel Izmaylov , Avi Segal , Oren Tsur , Yossi Levi-Belz , Kobi Gal

分类：自然语言处理

2022-09-11

随着人们对精神危机及其社会影响的认识，在许多国家，提供紧急支持的在线服务变得司空见惯。接受寻求帮助者和提供者之间讨论的培训的计算模型可以通过识别高危个人来支持预防自杀。但是，缺乏特定领域的模型，尤其是在低资源语言中，对自动检测自杀风险构成了重大挑战。我们提出了一个模型，该模型将预训练的语言模型（PLM）与固定的一组手动制作（并经过临床批准）的自杀提示相结合，然后进行了两阶段的微调过程。我们的模型达到了0.91 ROC-AUC和0.55的F2分数，甚至在对话的早期就表现出了一系列强大的基线，这对于该领域的实时检测至关重要。此外，该模型在性别和年龄段之间表现良好。

translated by 谷歌翻译

Adaptive Combination of a Genetic Algorithm and Novelty Search for Deep Neuroevolution

Eyal Segal , Moshe Sipper

分类：神经与进化计算

2022-09-08

进化计算（EC）已被证明能够快速训练深人造神经网络（DNNS）来解决增强学习（RL）问题。虽然遗传算法（GA）非常适合利用既不具有欺骗性也不稀疏的奖励功能，但当奖励函数是这些功能时，它会挣扎。为此，在某些情况下，新颖的搜索（NS）已被证明能够超越梯度跟随优化器，而在其他情况下则表现不佳。我们提出了一种新算法：探索 - 探索$ \ gamma $ - 适应学习者（$ e^2 \ gamma al $或eyal）。通过保留动态大小的寻求新颖的代理商的利基市场，该算法可以维持人口多样性，并在可能的情况下利用奖励信号并探索其他奖励信号。该算法将GA的剥削能力和NS的勘探能力结合在一起，同时保持其简单性和优雅性。我们的实验表明，在大多数情况下，Eyal在与GA相当的情况下都胜过NS - 在某些情况下，它可以均优于两者。 Eyal还允许用其他算法（例如演化策略和惊喜搜索）代替利用组件（GA）和探索组件（NS）（NS），从而为未来的研究打开了大门。

translated by 谷歌翻译

DDKtor: Automatic Diadochokinetic Speech Analysis

Yael Segal , Kasia Hitczenko , Matthew Goldrick , Adam Buchwald , Angela Roberts , Joseph Keshet

分类：机器学习

2022-06-29

参与者反复产生音节的Diadochokinetic语音任务（DDK）通常用作评估语音运动障碍的一部分。这些研究依赖于时间密集型，主观的手动分析，并且仅提供粗略的语音图片。本文介绍了两个深度神经网络模型，这些模型会自动从未注释，未转录的语音中分割辅音和元音。两种模型都在原始波形上工作，并使用卷积层进行特征提取。第一个模型基于LSTM分类器，然后是完全连接的层，而第二个模型则添加了更多的卷积层，然后是完全连接的层。这些模型预测的这些分割用于获得语音速率和声音持续时间的度量。年轻健康个体数据集的结果表明，我们的LSTM模型的表现优于当前的最新系统，并且与受过训练的人类注释相当。此外，在对帕金森氏病数据集的看不见的老年人进行评估时，LSTM模型还与受过训练的人类注释者相当。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

DeepFry: Identifying Vocal Fry Using Deep Neural Networks

Bronya R. Chernyak , Talia Ben Simon , Yael Segal , Jeremy Steffman , Eleanor Chodroff , Jennifer S. Cole , Joseph Keshet

分类：机器学习

2022-03-31

声带煎炸或吱吱作响的声音是指以不规则的发光开口和低音为特征的语音质量。它以各种语言发生，并且在美国英语中很普遍，不仅可以标记词组结局，还用于社会语言因素和影响。由于其不规则的周期性，吱吱作响的声音挑战自动语音处理和识别系统，尤其是对于经常使用吱吱作响的语言。本文提出了一个深度学习模型，以检测流利的语音中的吱吱作响的声音。该模型由编码器和经过训练的分类器组成。编码器采用原始波形，并使用卷积神经网络学习表示。分类器被实现为多头完全连接的网络，该网络训练有素，可检测吱吱作响的声音，发声和音调，最后两个用于完善吱吱作响的预测。该模型经过对美国英语说话者的言语的培训和测试，并由训练有素的语音家注释。我们使用两个编码器评估了系统的性能：一个是为任务量身定制的，另一个是基于最新的无监督表示。结果表明，与看不见的数据相比，我们表现最佳的系统的回忆和F1得分有所改善。

translated by 谷歌翻译

SCROLLS: Standardized CompaRison Over Long Language Sequences

Uri Shaham , Elad Segal , Maor Ivgi , Avia Efrat , Ori Yoran , Adi Haviv , Ankit Gupta , Wenhan Xiong , Mor Geva , Jonathan Berant

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-01-10

NLP基准在很大程度上主要集中在短篇文本上，例如句子和段落，即使长文本在野外占相当数量的自然语言。我们介绍卷轴，这是一套需要在长文本上推理的任务套件。我们检查现有的长文本数据集，文本自然是长期的，同时优先考虑涉及在输入上扫描信息的任务。滚动包含概述，问题应答和自然语言推理任务，包括多个域，包括文学，科学，业务和娱乐。初始基线（包括啰覆编码器），表明滚动有充足的改进空间。我们以统一的文本到文本格式提供所有数据集，并托管Live Refordboard，以促进模型架构和预用方法的研究。

translated by 谷歌翻译

Multiview Neural Surface Reconstruction by Disentangling Geometry and Appearance

Lior Yariv , Yoni Kasten , Dror Moran , Meirav Galun , Matan Atzmon , Ronen Basri , Yaron Lipman

分类：

2020-03-22

In this work we address the challenging problem of multiview 3D surface reconstruction. We introduce a neural network architecture that simultaneously learns the unknown geometry, camera parameters, and a neural renderer that approximates the light reflected from the surface towards the camera. The geometry is represented as a zero level-set of a neural network, while the neural renderer, derived from the rendering equation, is capable of (implicitly) modeling a wide set of lighting conditions and materials. We trained our network on real world 2D images of objects with different material properties, lighting conditions, and noisy camera initializations from the DTU MVS dataset. We found our model to produce state of the art 3D surface reconstructions with high fidelity, resolution and detail.

translated by 谷歌翻译